5 research outputs found

    gMark: Schema-Driven Generation of Graphs and Queries

    Full text link
    Massive graph data sets are pervasive in contemporary application domains. Hence, graph database systems are becoming increasingly important. In the experimental study of these systems, it is vital that the research community has shared solutions for the generation of database instances and query workloads having predictable and controllable properties. In this paper, we present the design and engineering principles of gMark, a domain- and query language-independent graph instance and query workload generator. A core contribution of gMark is its ability to target and control the diversity of properties of both the generated instances and the generated workloads coupled to these instances. Further novelties include support for regular path queries, a fundamental graph query paradigm, and schema-driven selectivity estimation of queries, a key feature in controlling workload chokepoints. We illustrate the flexibility and practical usability of gMark by showcasing the framework's capabilities in generating high quality graphs and workloads, and its ability to encode user-defined schemas across a variety of application domains.Comment: Accepted in November 2016. URL: http://ieeexplore.ieee.org/document/7762945/. in IEEE Transactions on Knowledge and Data Engineering 201

    GĂ©nĂ©ration de RequĂȘtes pour les Bases de DonnĂ©es OrientĂ©es Graphes

    No full text
    National audienceLes outils de gestion de bases de donnĂ©es orientĂ©es graphes sont actuellement en Ă©volution permanente. Dans ce contexte, les outils permettant une gĂ©nĂ©ration de donnĂ©es ainsi que de scĂ©narios de travail sont des Ă©lĂ©ments clĂ©s dans les Ă©tudes empiriques. NĂ©anmoins, les gĂ©nĂ©rateurs actuels de graphe fournissent un support limitĂ©, voire inexistant, dans la gĂ©nĂ©ration de scĂ©narios d'usage, ou s'en tiennent Ă  un nombre fixe de cas d'Ă©tudes. Afin de dĂ©passer ces limitations, nous prĂ©sentons gMark, le premier environnement de gĂ©nĂ©ration de graphes synthĂ©tiques et de scĂ©narios d'utilisation indĂ©pendant Ă  la fois du domaine et du langage de requĂȘte. Ses principales innovations sont : (i) un contrĂŽle prĂ©cis de l'instance de graphe gĂ©nĂ©rĂ© et des requĂȘtes correspondantes Ă  partir de schĂ©mas dĂ©finis par l'utilisateur ; (ii) le support d'un langage de requĂȘte expressif, incluant notamment la rĂ©cursion ; et (iii) une estimation de la sĂ©lectivitĂ© des requĂȘtes gĂ©nĂ©rĂ©es. Durant cette dĂ©monstration, nous illustrerons la capacitĂ© hautement paramĂ©trable des graphes et des requĂȘtes gĂ©nĂ©rĂ©s Ă  travers diffĂ©rents schĂ©mas et diffĂ©rentes sĂ©lectivitĂ©s choisies, et la variĂ©tĂ© des langages de requĂȘtes supportĂ©s par le systĂšme. Nous montrerons Ă©galement une comparaison des performances de quatre moteurs de requĂȘtes de l'Ă©tat de l'art, et comment les scĂ©narios gĂ©nĂ©rĂ©s par gMark nous permettent de comprendre leurs forces respectives, et les Ă©volutions que l'on pourrait souhaiter

    Generating Flexible Workloads for Graph Databases

    No full text
    International audienceGraph data management tools are nowadays evolving at a great pace. Key drivers of progress in the design and study of data intensive systems are solutions for synthetic generation of data and workloads, for use in empirical studies. Current graph generators, however, provide limited or no support for workload generation or are limited to fixed use-cases. Towards addressing these limitations, we demonstrate gMark, the first domain- and query language-independent framework for synthetic graph and query workload generation. Its novel features are: (i) fine-grained control of graph instance and query workload generation via expressive user-defined schemas; (ii) the support of expressive graph query languages, including recursion among other features; and, (iii) selectivity estimation of the generated queries. During the demonstration, we will showcase the highly tunable generation of graphs and queries through various user-defined schemas and targeted selectivities, and the variety of supported practical graph query languages. We will also show a performance comparison of four state-of-the-art graph database engines, which helps us understand their current strengths and desirable future extensions

    gMark : GĂ©nĂ©ration de Graphes et de RequĂȘtes DirigĂ©e par le SchĂ©ma

    No full text
    National audienceLes jeux de donnĂ©es reprĂ©sentĂ©s par des graphes de grande taille sont omniprĂ©sents dans les domaines applicatifs actuels. C'est pourquoi les bases de donnĂ©es orientĂ©es graphes jouent un rĂŽle de plus en plus important. Dans l'Ă©tude de ces systĂšmes, il est vital que la communautĂ© scientifique ait Ă  sa disposition des solutions pour gĂ©nĂ©rer des jeux de donnĂ©es de rĂ©fĂ©rence comprenant des instances de base de donnĂ©es et des requĂȘtes ayant des propriĂ©tĂ©s prĂ©visibles et contrĂŽlables. Dans cet article, nous prĂ©sentons les principes Ă  la fois thĂ©oriques et d'ingĂ©nierie de gMark, un systĂšme gĂ©nĂ©rique de gĂ©nĂ©ration de graphes et de requĂȘtes basĂ© sur une gestion flexible des schĂ©mas et des requĂȘtes. Une contribution centrale de gMark est sa capacitĂ© Ă  viser et Ă  contrĂŽler la diversitĂ© des propriĂ©tĂ©s Ă  la fois des instances de graphes gĂ©nĂ©rĂ©s et des requĂȘtes correspondantes Ă  celles ci. Une autre innovation est la capacitĂ© Ă  gĂ©nĂ©rer des requĂȘtes rĂ©cursives basĂ©es sur des expressions rĂ©guliĂšres de chemin, un paradigme important dans les requĂȘtes sur les graphes. Nous illustrons Ă  la fois la flexibilitĂ© et l'applicabilitĂ© de gMark en montrant ses capacitĂ©s Ă  gĂ©nĂ©rer des graphes et des requĂȘtes de haute qualitĂ©, et sa capacitĂ© Ă  exploiter des schĂ©mas dĂ©finis par l'utilisateur dans plusieurs domaines applicatifs diffĂ©rents

    GĂ©nĂ©ration de RequĂȘtes pour les Bases de DonnĂ©es OrientĂ©es Graphes

    No full text
    National audienceLes outils de gestion de bases de donnĂ©es orientĂ©es graphes sont actuellement en Ă©volution permanente. Dans ce contexte, les outils permettant une gĂ©nĂ©ration de donnĂ©es ainsi que de scĂ©narios de travail sont des Ă©lĂ©ments clĂ©s dans les Ă©tudes empiriques. NĂ©anmoins, les gĂ©nĂ©rateurs actuels de graphe fournissent un support limitĂ©, voire inexistant, dans la gĂ©nĂ©ration de scĂ©narios d'usage, ou s'en tiennent Ă  un nombre fixe de cas d'Ă©tudes. Afin de dĂ©passer ces limitations, nous prĂ©sentons gMark, le premier environnement de gĂ©nĂ©ration de graphes synthĂ©tiques et de scĂ©narios d'utilisation indĂ©pendant Ă  la fois du domaine et du langage de requĂȘte. Ses principales innovations sont : (i) un contrĂŽle prĂ©cis de l'instance de graphe gĂ©nĂ©rĂ© et des requĂȘtes correspondantes Ă  partir de schĂ©mas dĂ©finis par l'utilisateur ; (ii) le support d'un langage de requĂȘte expressif, incluant notamment la rĂ©cursion ; et (iii) une estimation de la sĂ©lectivitĂ© des requĂȘtes gĂ©nĂ©rĂ©es. Durant cette dĂ©monstration, nous illustrerons la capacitĂ© hautement paramĂ©trable des graphes et des requĂȘtes gĂ©nĂ©rĂ©s Ă  travers diffĂ©rents schĂ©mas et diffĂ©rentes sĂ©lectivitĂ©s choisies, et la variĂ©tĂ© des langages de requĂȘtes supportĂ©s par le systĂšme. Nous montrerons Ă©galement une comparaison des performances de quatre moteurs de requĂȘtes de l'Ă©tat de l'art, et comment les scĂ©narios gĂ©nĂ©rĂ©s par gMark nous permettent de comprendre leurs forces respectives, et les Ă©volutions que l'on pourrait souhaiter
    corecore